区間推定を理解する-04

母平均がわかっていなくて,母分散もわかっていない場合の区間推定 : t検定

前ページに示しましたように,”母分散σがわかっている場合”の区間推定の計算方法を示しました.

\(\Large \bar{x} - 1.96 \times \sqrt{\frac{\sigma^2}{n}} \hspace{12 pt}\leq \hspace{12 pt} \mu \hspace{12 pt} \leq \hspace{12 pt} \bar{x} + 1.96 \times \sqrt{\frac{\sigma^2}{n}} \)

すなわち,

 測定平均,\(\Large \bar{x} \) と母分散σ2,と試行回数nがわかれば,母平均μの範囲がわかる=区間推定ができる

というものでした.

しかし,そもそもわからないものを推定するのですから,母分散σ2,だってわからないのが当然でしょう.

測定からわかるのはせいぜい,不偏分散,ぐらい...

\(\Large \displaystyle s^2 = \frac{ \displaystyle \sum_{i=1}^n (x_i - \bar{x})^2}{n-1} \)

じゃあ,何とか,σ2が入った関係式を見つけ出し,それをうまく組み合わせることにより,σ2を消去し,を残せば,実際に得られたデータから区間推定ができるんじゃないかと考えたのが,

 t検定

です(と思います.....).

つまり,母分散がわかっている状態での区間推定で使われている指標をZとすると,

\(\Large Z =\displaystyle \frac{\bar{x} - \mu}{ \sqrt{\frac{\sigma^2}{n}}} \rightarrow \frac{\bar{x} - \mu}{ \sqrt{\frac{s^2}{n}}} = t \)

と変換すればいいのです.これからの導出は,こちらのサイト,を参考にしました,ありがとうございます.まず,

\(\Large \displaystyle s^2 = \frac{ \displaystyle \sum_{i=1}^n (x_i - \bar{x})^2}{n-1} \)

です,すると,

\(\Large t = \displaystyle \frac{\bar{x} - \mu}{ \sqrt{\frac{s^2}{n}}} = \frac{\bar{x} - \mu}{ \sqrt{ \displaystyle \frac{1}{n} \displaystyle \frac{ \displaystyle \sum_{i=1}^n (x_i - \bar{x})^2}{n-1}}}\)

となります.

ここで,新しい指標,U,を導入します.ここには,σ2が入っているので期待大です

\(\Large \displaystyle U = \frac{(n-1) s^2}{ \sigma^2} = \frac{ \displaystyle \sum_{i=1}^n (x_i - \bar{x})^2}{ \sigma^2} = \chi_{n-1}^2\)

最後の,

\(\Large \displaystyle \chi_{n-1}^2\)

は自由度1のカイ二乗分布となります(導出はこちらで)

\(\Large \displaystyle s^2 = \frac{ U \sigma^2}{ n-1} \)

となるので,

\(\Large \displaystyle Z =\displaystyle \frac{\bar{x} - \mu}{ \sqrt{\frac{\sigma^2}{n}}} \rightarrow \bar{x} - \mu = \sqrt{ \frac{\sigma^2}{n}} Z\)

\(\Large \displaystyle t = \frac{\bar{x} - \mu}{ \sqrt{\frac{s^2}{n}}} \rightarrow \frac{\sqrt{ \frac{\sigma^2}{n}} Z}{ \sqrt{\frac{s^2}{n}}}
= \displaystyle \frac{\sqrt{ \frac{\sigma^2}{n}} Z}{ \displaystyle \sqrt{\frac{1}{n} \frac{U \sigma^2}{n-1}}}
= \frac{Z}{\sqrt{ \frac{U}{n-1}}} \)

tの分布は,自由度n-1のカイ二乗分布(U)とZ(標準化正規分布)に従う分布となります.

実際のtの値は,

\(\Large \displaystyle t = \frac{\sqrt{ \frac{\sigma^2}{n}} Z}{ \sqrt{\frac{s^2}{n}}} \)

ですが,

\(\Large Z =\displaystyle \frac{\bar{x} - \mu}{ \sqrt{\frac{\sigma^2}{n}}} \)

ですので,

\(\Large \displaystyle t = \frac{\sqrt{ \frac{\sigma^2}{n}} Z}{ \sqrt{\frac{s^2}{n}}} = \frac{\bar{x} - \mu}{ \sqrt{\frac{s^2}{n}}}\)

として実験結果から計算することができます.

つまり,

母分散がわかっている場合は,

\(\Large \displaystyle - 1.96 \hspace{52 pt}\leq \hspace{12 pt} \frac{\mu - \bar{x}}{ \sqrt{\frac{\color{red}{\sigma}^2}{n}}} \hspace{12 pt} \leq \hspace{12 pt} 1.96 \)

母分散がわからない場合には,

\(\Large \displaystyle - t_{\alpha/2} (n-1) \hspace{12 pt}\leq \hspace{12 pt} \frac{\mu - \bar{x}}{ \sqrt{\frac{\color{red}{s}^2}{n}}} \hspace{12 pt} \leq \hspace{12 pt} t_{\alpha/2} (n-1) \)

となるのです.

t分布自体は,

\(\Large \displaystyle f(t) = \frac{ \Gamma (\frac{n}{2}) }{ \sqrt{(n-1) \pi} \ \Gamma ( \frac{n-1}{2})} \left( 1 + \frac{t^2}{n-1} \right)^{- \frac{n}{2}}\)

となりますが,この導出は.....ここ,にありますが...勉強します.

なんとか解けました!,ここ,に記しました!

実際の波形は,

と若干先鋭化した正規分布のような形となります.

 

では,ここで重要となる,

\(\Large \displaystyle \chi_{n-1}^2 \)

という,自由度1のカイ二乗分布を検討していきましょう.

 

 

l t r